数据统计与分析基础 | 您所在的位置:网站首页 › 薪酬设计 增长率 gdp cpi › 数据统计与分析基础 |
实验目的:掌握使用实用软件通过各类基础的机器学习算法解决实际数据统计分析任务的能力,熟悉线性回归、SVM、kmeans、PCA等算法的调用。 实验工具:python 实验内容: 1、对于下表中的数据,对1990年-2005年内的数据建立人口自然增长率对于国民总收入、CPI增长率和人均GDP的三元线性回归模型。 #人口自然增长率对于国民总收入、CPI增长率和人均GDP的三元线性回归模型 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt df = pd.read_csv('z.csv',encoding='gbk')#在本目录下新建z.csv文件,录入表格中数据,用pd.read_csv()函数读取z.csv文件中的数据 df.info() df.head(19)#人口自然增长率:population_growth_rate,国民总收入:gross_nation_income,GPI增长率:GPI_growth_rate,人均GDP:GDP_per_captia数据部分展示: 模型各项数据:
2、下载UCI中wine数据集:http://archive.ics.uci.edu/ml/datasets/Wine。所下载数据可以用txt打开,其中每一行数据为一种Wine的记录,每条记录包含14个维度,其中第一维为该Wine类别,后面13维为具体的Wine属性。请基于所有的178个Wine样本对Wine的13个维度进行PCA降维分析,将贡献率之和大于90%的成分提取,并将原13维属性数据映射为新数据。 #读取数据 import numpy as np import pandas as pd date = pd.read_csv('wine.data') # 需要在wine数据集补0~13作为标头 date.head()读取数据: |
CopyRight 2018-2019 实验室设备网 版权所有 |